1
Estatísticas como Variáveis Aleatórias: A Distribuição Amostral
MATH003Lesson 4
00:00
Na inferência estatística, passamos de observar pontos individuais de dados para analisar uma **estatística** — uma aplicação funcional $Y = h(X_1, X_2, \dots, X_n)$ de uma sequência amostral. Como a amostra subjacente é composta por variáveis aleatórias, a própria estatística é uma variável aleatória, e sua lei de probabilidade é conhecida como a **distribuição amostral**.

A Estatística como uma Aplicação

Uma estatística é formalmente definida como uma função $h: \mathbb{R}^n \to \mathbb{R}$. Definimos a probabilidade de a estatística cair em um conjunto $B$ usando a pré-imagem:

$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$

Fundamento i.i.d.

Para uma amostra de variáveis aleatórias i.i.d. (independente e identicamente distribuídas), a probabilidade conjunta de um ponto amostral específico $(x_1, \dots, x_n)$ é o produto de suas probabilidades marginais: $p(x_1)p(x_2)\dots p(x_n)$. Esse produto serve como peso para cada ponto ao calcular a probabilidade total de a estatística assumir um valor específico.

Exemplo 4.1.1: A Média Geométrica

Considere uma população discreta onde $p_X(1) = 1/2$, $p_X(2) = 1/4$ e $p_X(3) = 1/4$. Extraímos uma amostra de tamanho $n=2$ ($X_1, X_2$) e definimos nossa estatística como a média geométrica: $Y_2 = (X_1 X_2)^{1/2}$.

Para encontrar a distribuição de $Y_2$, listamos todas as 9 combinações possíveis $(X_1, X_2)$, calculamos suas probabilidades conjuntas e o valor resultante de $Y_2$:

Par $(x_1, x_2)$Prob $P(x_1)P(x_2)$$Y = \sqrt{x_1 x_2}$
(1, 1)1/41,000
(1, 2), (2, 1)1/8 + 1/8 = 1/41,414
(1, 3), (3, 1)1/8 + 1/8 = 1/41,732
(2, 2)1/162,000
(2, 3), (3, 2)1/16 + 1/16 = 1/82,449
(3, 3)1/163,000

Distribuições Exatas vs. Assintóticas

Antes de avançar para teoremas limite como o Teorema do Limite Central (TLC), devemos dominar a "Distribuição Exata". Isso envolve calcular a função específica de massa ou densidade de probabilidade para uma estatística dado um $n$ pequeno e finito. Quando a forma analítica se torna intratável, recorremos a simulações numéricas como as **aproximações de Monte Carlo**.

🎯 Princípio Fundamental
Uma distribuição amostral é a distribuição de uma variável aleatória correspondente a uma função de uma sequência i.i.d. Ela é o elo entre os dados brutos e a inferência científica.